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摘要 : [目的 /意义 ] 在 线 健康 社区 迅速 发 展 ， 


但 缺乏 结合 网 络 结 点 属性 与 网 络 结构 的 动态 网 络 特征 的 


研究 ， 因 而 难以 揭示 基于 结 点 属性 的 用 户 动态 交互 模式 的 形成 机 理 。[ 方 法 / 过程 ] 应 用 基于 节点 属性 的 
时 序 指 数 随机 图 模型 ， 以 在 线 健康 社区 为 研究 对 象 ， 结 合用 户 节点 属性 特征 ， 包 括 用 户 发 文 情感 倾向 、 用 
户 发 文 文本 长 度 和 用 户 社 区 等 级 ， 构 建 在 线 健 康 社区 的 用 户 时 序 交 互 模 式 研究 模型 ， 从 百度 贴吧 的 糖尿 病 
吧 抓 取 2016 年 10 月 至 2018 年 2 月 期 间 2301 个 有 效用 户 ，6 045 条 主 帖 和 9 490 条 回复 ， 实 证 用 户 时 序 
交互 模式 特征 。 [ 结果 / 结论 ] 用 户 属性 特征 对 互惠 性 时 序 模式 、k-star 时 序 模式 、 传 递 性 时 序 模式 和 循环 
性 时 序 模式 形成 有 显著 影响 ， 并 由 此 为 在 线 健康 社区 建设 提出 发 展 建议 。 

关键 词 : 在 线 健康 社区 ”节点 属性 用 户 交互 模式 NAIERGM 
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在 线 健康 社区 以 医疗 信息 分 享 和 交流 为 主 
要 目的 ， 越 来 越 多 的 人 尝试 通过 在 线 健康 社区 
解决 健康 相关 问题 。 因 此 ， 在 线 健康 社区 的 发 
展 正在 推动 传统 医疗 改革 ， 以 逐步 缓解 我 国医 
Yr EUER A gU. 根据 用 户 的 构成 ， 在 线 健 
康 社区 可 以 分 为 3 类: 医疗 工作 者 社区 ( 如 丁 
香 园 ) 、 医 患 社 区 (如 好 大 夫 在 线 ) 和 病 患 者 
社区 ( 如 百度 医疗 贴吧 ) , 分 别 为 医疗 工作 者 、 医 
患 和 病 患 者 之 间 相 互 发 现 与 相互 支持 搭建 了 沟 
通 与 联系 的 桥梁 。 近 年 来 ,我 国 慢 性 病 患 者 持 
续 增 长 ， 以 糖尿 病 及 其 并 发 症 为 例 ， 据 国际 


糖尿 病 联 盟 (International Diabetes Federation, 
IDF ) 报告 显示 ， 预 计 到 2045 年 ， 全 球 糖尿 病 
患者 可 能 达到 6.29 亿 。 慢 性 病 群 体 更 倾向 于 利 
用 互联 网 来 搜寻 疾病 信息 以 及 与 患者 交流 站， 因 
此 ， 以 病 患者 之 间 互 助 为 中 心 的 病 患者 社区 成 
为 病 患者 信息 互惠 、 经 验 分 享 与 情感 支持 的 重 
要 平台 ， 尤 其 需要 揭示 用 户 属 性 与 时 序 交 互 模 
式 形成 的 内 在 机 理 ， 但 目前 相关 研究 缺乏 。 
因此 ， 笔 者 将 从 动态 集成 视角 ， 应 用 基 
于 节点 属性 的 时 序 指数 随机 图 模型 (Node 


Attribute-based Temporal Exponential Random 


0000-0002-4335-7929) ， 硕 士 研究 生 。 
收 稿 日 期 : 2019-02-27 发 表 日 期 : 2019-06-18 


作者 简介 : žk (ORCID:0000-0002-5936-1631) ， 副 教授 ， 博 士 ，E-mail: ww_bing@163.com; 彭 或 (ORCID: 


本 文责 任 编辑 : 刘 远 颖 


202310.03204v1 


chinaXiv 


知识 管理 论坛 


2019 年 第 3 期 (总 第 21 期 ) 


< 局 一 


www.kmf.ac.cn 


Graph Model NATERGM ) ， 结 合 在 线 病 患 者 社 
区 的 用 户 节点 属性 特征 ， 构 建 在 线 病 患者 社区 
的 用 户 时 序 交 互 模式 人 研究 模型 ， 从 百度 贴吧 糖 
尿 病 吧 抓 取 数 据 ， 进 行 实 证 研究 ， 探 究 基 于 用 
户 节 点 属性 的 动态 交互 模式 形成 机 理 。 在 理论 
上 ,丰富 和 扩展 在 线 健康 社区 的 用 户 时 序 交 互 
机 制 研究 体系 ; 在 实践 上 ， 为 在 线 健康 社区 的 
建设 与 发 展 提供 方向 和 建议 。 


QO 相关 文献 综述 


1.1 在 线 健 康 社区 的 用 户 交 互 模式 分 析 

在 线 健康 社区 被 定义 为 关注 共同 健康 问 
题 的 用 户 集 合 ， 用 户 可 以 被 视 为 行动 者 ， 用 户 
之 间 的 交互 可 以 被 视 为 不 同行 动 者 之 间 的 关 
联 。 目 前 ， 关 于 在 线 健 康 社 区 的 用 户 交互 模式 
分 析 ， 主 要 有 3 类 研究 : 四 从 社区 网 络 结构 角 
度 ， 采 用 社会 网 络 分 析 ， 描 述 特 定 的 在 线 健康 
社区 中 社会 网 络 结构 特点 及 其 影响 因素 。 例 
如 ， 社 会 网 络 分 析 得 到 的 中 心性 可 以 作为 挖掘 
在 线 健 康 社区 中 关键 用 户 的 主要 特征 之 一 品 。 
@ 从 社区 网 络 个 体 角度 ， 研 究 关 注 在 线 健康 社 
区 中 个 体 属性 及 其 行为 模式 。 例 如 ， 在 线 健康 
社区 中 知识 分 享 网 络 具 有 小 世界 效应 ， 社 区 成 
员 最 关注 他 人 分 享 的 经 验 知识 ， 不 同 用 户 群 体 
的 知识 分 享 行为 和 活跃 时 长 有 显著 差异 US. 社 
会 网 络 分 析 用 户 行 为 ， 可 以 探索 在 线 健康 社区 
网 络 中 不 同 群 组 间 以 及 不 同 角 色 间 的 知识 分 享 行 
为 上。 图 从 社区 网 络 形成 机 理 角度 ， 应 用 指数 
随机 图 模型 ( Exponential Random Graph Model, 
ERGM , ， 研 究 在 线 健康 社区 用 户 交 互 模式 。 
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在 时 序 指数 随机 图 模型 (Temporal 
Exponential Random Graph Model, TERGM ) X 
础 上 上， 近年 来 发 展 的 基于 节点 属性 的 时 序 指数 
随机 图 模型 将 结 点 属性 整合 到 TERGM， 由 此 该 
模型 适用 于 研究 节点 属性 作用 下 的 用 户 交 互 网 
络 动态 形成 机 理 。 例 如 ， 从 知识 共享 社区 收集 
实证 数据 ， 应 用 NATERGM 可 以 识别 和 预测 节 
点 属性 对 网 络 二 元 和 三 元 关系 动态 形成 模式 的 
影响 "。 因 此 ， 笔 者 将 应 用 NATERGM 研究 在 
线 健康 社区 中 节点 属性 对 用 户 动态 交互 模式 的 
影响 ， 揭 示 用 户 时 序 交互 模式 形成 机 理 。 
1.2 NATERGM 

给 定 一 个 观察 网 络 ， 指 数 随 机 图 模型 的 主 
要 任务 是 统计 检验 网 络 中 哪些 节点 连接 模式 的 
出 现 不 是 偶然 ， 如 公式 CT) 所 示 ml: 


PY-y- CO exp(Y mg, 0) 27 (QU 


其 中 : OPOS) 是 一 个 概率 分 布 , 了 是 
一 个 随机 变量 和 矩阵， 表示 网 络 连接 , y 是 了 的 
实现 ; @ 4 是 节点 连接 模式 ，g40) 是 与 4 相 
对 应 的 网 络 统计 ; @@ 上 是 一 个 比例 参数 ， 确 保 
P(Yzy) 是 一 个 随机 分 布 ; O q 是 与 节点 连接 模 
式 4 相对 应 的 参数 ， 与 节点 连接 模式 4 出 现 的 
可 能 性 正 相 关 ， 如 果 参 数 y 是 显著 的 ， 表 明 节 
点 连接 模式 4 更 有 可 能 会 出 现在 网 络 中 ， 由 此 
说 明 节 点 连接 模式 4 对 网 络 形成 过 程 有 重要 的 
影响 。 

TERGM 是 ERGM 向 动态 网 络 的 延伸 ， 在 
公式 (1) 的 基础 上 ,一 阶 马尔 可 夫 依 赖 的 
TERGM， 如 公式 (2) Hrs "", TERGM 的 主 


例如 ， 利 用 ERGM 分 析 在 线 健康 社区 中 用 户 属 
性 特征 和 行为 特征 对 网 络 连接 模式 的 影响 T 

由 此 ， 目 前 在 线 健康 社区 中 用 户 交 互 模式 
的 相关 研究 主要 存在 两 个 问题 : 四 孤立 分 析 网 
络 结 点 属性 与 网 络 结构 ， 然 而 网 络 结 点 属性 是 
用 户 交互 网 络 结构 的 重要 组 成 ; @ 缺 乏 网 络 结 
点 属性 与 用 户 交互 网 络 的 动态 集成 研究 ， 因 而 
难以 揭示 网 络 结 点 属性 与 动态 网 络 连接 形成 的 
内 在 机 理 。 
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要 目标 是 检测 在 时 序 (六 1 和 1) ， 节 点 连接 时 
序 模式 4 是 否 更 可 能 出 现 。 


P(Y' 一 y y"! - y) = 
1 m 公式 (2) 
(一 二 )exp{2 ng 0y) 
k(y A 
NATERGM 是 在 TERGM 中 增加 节点 属 


性 ， 在 公式 (2) 的 基础 上 ，NATERGM 的 计算 如 
公式 (3) 所 示 U9l. 
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P(Y =y 


n)= 四 by n,g, QT, X | 
acA 

公式 (3) 

其 中 : 中 4 是 要 验证 的 节点 连接 时 序 模 
NES; Oyin] 是 一 个 向 量 参数 ， 表 示 每 个 
节点 连接 时 序 模式 对 网 络 形成 的 影响 ，@g 0， 
7, 了 DD 是 节点 连接 时 序 模式 a 的 网 络 统计 ， 参 
数 为 : Wy. 时 间 戳 矩阵 了 和 节点 属性 向 
量 参数 估计 采用 马尔 可 夫 蒙 特 卡 罗 


— 一 一 一 一 一 一 一 一 一 一 一 一 一 


时 间 戳 


2.1 网 络 构建 

首先 ， 基 于 在 线 健康 社区 用 户 的 交互 关系 
构建 有 向 网 络 连 接 ， 用 为 表 示 网 络 用 户 节 点 
ij 之 间 的 有 癌 连 接 ， 如 果 节 点 i 指向 节点 j， 则 
Yj-1; 否则 %=0。 识别 用 户 节 点 间 所 有 的 有 疝 
连接 后 ， 具 有 Y 个 节点 的 有 向 网 络 连接 可 表示 
为 矩阵 Y-[Y,], (iy=1,2,…, N)o 

其 次 ， 基 于 在 线 健康 社区 用 户 交 互 的 有 向 
网 络 连接 , JH T 记录 网 络 用 户 节 点 iy 之 间 的 有 
向 连接 建立 时 间 ， 如 有 果 节 点 i 指向 节点 j 的 时 间 
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( Markov Chain Monte Carlo, MCMC ) 方法 。 
因此 ，NATERGM 的 主要 目标 是 检验 具有 属性 
对 的 节点 在 时 序 7， 节 点 连接 时 序 模式 4 是 否 
更 可 能 出 现 。 


© 在 线 健康 社区 中 用 户 时 序 交 互 模 
式 的 NATERGM 分 析 框 架 


NATERGM 通过 检查 带 有 时 间 戳 的 网 络 节 
点 连接 截面 数据 ， 准 确 地 跟踪 网 络 节点 连接 时 
序 ， 其 基本 分 析 框 架 如 图 1 所 示 


拟 合 效果 比较 
仿真 网 络 生成 


威 尔 科 克 森 符号 秩 检验 


图 1 NATERGM 分 析 框 架 


户 属性 向 量 , 原因 在 于 : 中 在 线 健康 社区 中 , 情 
感 因 素 对 病 患 交 互 的 形成 起 着 至 关 重 要 的 作 
JH"; @ 平 均 发 帖 长 度 更 长 ， 具 有 较 高 写作 能 
力 的 用 户 有 助 于 提供 更 多 的 信息 支持 ""; OF 
线 健康 社区 中 , 不 同 的 用 户 行为 ,如 每 日 签到 、 发 
帖 和 回复 等 ， 都 被 赋予 了 大 小 不 等 的 经 验 值 ， 通 
过 累计 经 验 等 级 ， 体 现 了 用 户 的 参与 度 和 贡献 
E. 
2.2 时 序 交 互 模式 的 NATERGM 拟 合 

根据 在 线 健康 社区 的 用 户 属性 向 量 ， 笔 者 


早 于 节点 j 指 向 节点 i 的 时 间 ， 则 TOT ius 
用 户 节点 间 所 有 的 有 向 连接 建立 时 间 后 ， 具 有 
N 个 节点 的 有 向 网 络 连接 时 间 可 以 表示 为 矩阵 
T-(7;], (ij-1,2,:-*, N). 

第 三 ， 基 于 在 线 健康 社区 用 户 的 节点 属性 
特征 ， 用 x 表示 每 个 网 络 节点 i 的 属性 值 ， 具 有 
NN 个 节点 的 有 向 网 络 节点 属性 值 ， 可 表示 为 向 
量 Xfx x], (iy=1,2,…, 和 NN。 根据 在 线 健康 
社区 的 社会 支持 作用 ， 笔 者 将 用 户 发 文 情感 倾 
向 、 用 户 发 文 文本 长 度 和 用 户 社 区 等 级 作为 用 


着 重 研究 二 元 关系 UU 的 互惠 性 以 及 三 元 关系 UI 
的 k-star 关系 、 传 递 性 和 循环 性 ， 见 表 1- K 4。 
其 中 ， 白 节点 代表 一 般 用 户 ， 黑 节点 代表 具有 
某 一 属性 特征 的 用 户 ; 虚线 箭头 连接 是 在 实 线 
箭头 连接 基础 上 发 展 的 网 络 连 接 ; 当 节点 属性 
蕊 为 分 类 属性 ，7CO=0 或 1， 当 节点 属性 马 为 
ERRE, IX) 为 蕊 属性 值 。 
2.2.1 互惠 性 时 序 模式 

互惠 性 (reciprocity ) 是 指 在 网 络 中 两 个 
互相 连接 的 节点 所 构成 的 子 集 ， 可 以 描述 为 
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10 一 站 4 一 站。 在 线 社区 的 本 质 是 一 个 基于 
社会 资本 交换 和 文化 互惠 性 的 实体 A, ERE 
康 社区 中 用 户 交 互 具 有 互惠 性 5。 由 此 ， 笔 者 
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将 结合 时 序 ， 研 究 节 点 属性 对 互惠 性 时 序 连 接 
产生 的 影响 ， 时 序 假 设 及 其 网 络 统计 公式 ， 如 
表 1 所 示 : 


表 1 NATERGM 的 时 序 互 惠 性 
互惠 模式 图 示 时 序 假设 

; j Hla: 发 文 情感 积极 的 用 户 更 可 能 收 到 其 他 用 户 的 反馈 
反馈 (feedback) e-* -人 ~ Hlb: 发 文 文本 较 长 的 用 户 更 可 能 收 到 其 他 用 户 的 反馈 
TONERS Hle: 社区 等 级 较 高 的 用 户 更 可 能 收 到 其 他 用 户 的 反馈 

j H2a: 发 文 情感 积极 的 用 户 更 可 能 回复 其 他 用 户 

回复 (Response) e. ^^ H2b: 发 文 文本 较 长 的 用 户 更 可 能 回复 其 他 用 户 

< H2c: 社区 等 级 较 高 的 用 户 更 可 能 回复 其 他 用 户 


2.2.2 k-star 时 序 模式 

k-star 模式 指 网 络 中 某 个 节点 和 其 他 数 个 与 
其 相连 的 节点 所 组 成 的 子 集 , 笔者 重点 研究 2-star 
模式 。 在 有 向 图 中 ，k-star 被 分 为 k-in-start 和 
k-out-star, k-in-star 在 一 定 程 度 上 反应 了 市 点 在 
网 络 中 受 欢迎 的 程度 或 者 聚敛 性 ; k-out-star 在 一 


定 程度 上 反应 了 节点 在 网 络 中 的 发 散 性 或 者 社会 
影响 力 ， 网 络 节 点 的 受 欢 迎 程度 和 社会 影响 力 会 
影响 网 络 连 接 的 形成 中 ， 在 线 健康 社区 中 用 户 
交互 存在 k-star 连接 ,由 此 ,笔者 将 结合 时 序 , 研 
究 节点 属性 对 k-star 时 序 连接 产生 的 影响 ， 时 序 
假设 及 其 网 络 统计 公式 ， 如 表 2 所 示 : 


表 2 NATERGM 的 时 序 k-star 


交互 模式 图 示 时 序 假设 

| i H3a; 发 文 情感 积极 的 用 户 更 可 能 抢先 连接 其 他 用 户 

Nds i urbi H3b: 发 文 文本 较 长 的 用 户 更 可 能 抢先 连接 其 他 用 户 

nita Pu H3c: 社区 等 级 较 高 的 用 户 更 可 能 抢先 连接 其 他 用 户 

" i H4a: 发 文 情感 积极 的 用 户 更 可 能 拖延 连接 其 他 用 户 
-In-Star - 


P dis H4b: 


k 
拖延 (Laziness) e 
H4c: 
: H5a: 
k-out-star Ó 9 H Sb. 


优先 (Priority) 


S aO H5c: 
: H6 
k-out-star k - 9 He. 
滞后 (DePriority) a ien 


22.3 传递 性 时 序 模式 

对 于 网 络 中 ijk 三 个 节点 ， 传 递 性 
( transitivity ) 可 以 被 描述 为 边 集 合 : 41G J), 
G 一 月 ,0 一 用) 笔者 研究 传递 性 桥接 、 传 递 性 
追随 和 传递 性 引用 。 在 社会 网 络 中 ， 人 们 倾向 


: 发 文 文本 较 长 的 用 户 更 可 能 被 其 他 用 户 滞后 连接 


发 文 文本 较 长 的 用 户 更 可 能 拖延 连接 其 他 用 户 
社区 等 级 较 高 的 用 户 更 可 能 拖延 连接 其 他 用 户 
发 文 情感 积极 的 用 户 更 可 能 被 其 他 用 户 优先 连接 
发 文 文本 较 长 的 用 户 更 可 能 被 其 他 用 户 优 先 连 接 
社区 等 级 较 高 的 用 户 更 可 能 被 其 他 用 户 优先 连接 


发 文 情感 积极 的 用 户 更 可 能 被 其 他 用 户 滞后 连接 


社区 等 级 较 高 的 用 户 更 可 能 被 其 他 用 户 滞后 连接 


于 和 朋友 的 朋友 建立 网 络 关 系 "04， 在 线 健 康 社 
区 中 用 户 交 互 存在 传递 性 连接 关系 中。 由 此 ， 笔 
者 将 结合 时 序 ， 人 研究 节点 属性 对 传递 性 时 序 连 
接 所 产生 的 影响 ， 时 序 假设 及 其 网 络 统计 公式 
如 表 3 所 示 : 
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表 3 NATERGM 的 传递 性 时 序 


交互 模式 图 示 时 序 假设 
桥接 i H7a: 发 文 情感 积极 的 用 户 更 可 能 桥接 其 他 用 户 
hoan Fa OOO HTb; 发 文 文本 较 长 的 用 户 更 可 能 桥接 其 他 用 户 
g us: H7e: 社区 等 级 较 高 的 用 户 更 可 能 桥接 其 他 用 户 
LX H8a: 发 文 情感 积极 的 用 户 更 可 能 传递 追随 其 他 用 户 
i jw Ni H8b: 发 文 文本 较 长 的 用 户 更 可 能 传递 追随 其 他 用 户 
p TT H8e: 社区 等 级 较 高 的 用 户 更 可 能 传递 追随 其 他 用 户 
有 i Hoa: 发文 情感 积极 的 用 户 更 可 能 被 其 他 用 户 传递 引用 
TUN jÁ Ne H9b: 发 文 文本 较 长 的 用 户 更 可 能 被 其 他 用 户 传递 引用 
H9c: 社区 等 级 较 高 的 用 户 更 可 能 被 其 他 用 户 传递 引用 


2.2.4 循环 性 时 序 模式 

对 于 网 络 中 ij,k 三 个 节点 ， 循 环 性 
(cyclicity ) 可 以 被 描述 为 边 集 合 : {(i Jj), 
0 一 月 , E 一 让， 与 传递 性 研究 对 应 ， 笔 者 研 
究 循 环 性 反 向 桥接 、 循 环 性 反 向 追随 和 循环 性 
反 向 引用 。 在 对 独 独 族群 所 构成 的 社会 网 络 的 


研究 过 程 中 发 现 ， 当 食物 短缺 时 ,个 体 间 表现 
出 了 明显 的 循环 性 交互 ""， 在 线 健 康 社区 中 
用 户 交互 存在 循环 连接 关系 ""。 因 此 ， 笔 者 将 
结合 时 序 ， 人 研究 节点 属性 对 循环 性 时 序 连接 产 
生 的 影响 ， 时 序 假设 及 其 网 络 统计 公式 如 表 4 
所 示 : 


表 4 NATERGM 的 时 序 循环 性 


交互 模式 图 示 时 序 假设 
Eis : H10a: 发 文 情 感 积极 的 用 户 更 可 能 反 向 桥接 其 他 用 户 
ad "a k H10b: 发 文 文本 较 长 的 用 户 更 可 能 反 向 桥接 其 他 用 户 
8 a Hl0c: 社区 等 级 较 高 的 用 户 更 可 能 反 向 桥接 其 他 用 户 
反 向 追随 [X Hlla: 发 文 情 感 积 极 的 用 户 更 可 能 循环 追随 其 他 用 户 
( reversed j A k Hllb: 发 文 文本 较 长 的 用 户 更 可 能 循环 追随 其 他 用 户 
followup ) a Hile: 社区 等 级 较 高 的 用 户 更 可 能 循环 追随 其 他 用 户 
反问 引用 i H12a: 发 文 情感 积极 的 用 户 更 可 能 被 其 他 用 户 循 环 引 用 
( reversed jy k H12b: 发 文 文本 较 长 的 用 户 更 可 能 被 其 他 用 户 循环 引用 
reference ) Hl2c: 社区 等 级 较 高 的 用 户 更 可 能 被 其 他 用 户 循环 引用 


2.3 NATERGM 拟 合 效果 比较 

比较 步骤 如 下 : 首先 ， 基 于 在 时 间 点 (710 
测 的 实际 网 络 ， 估 计 NATERGM 的 参数 1 ,; HE 
H, F NATERGM 仿真 生成 时 间 点 1 的 K 个 
与 实际 类 似 的 网 络 ; 第 三 ， 将 仿真 生成 的 K 个 
网 络 与 实际 网 络 比较 绝对 差异 , 如 公式 (4 ) 所 示 : 


AD, =l -Èg od) 公式 (4) 


其 中 , yy 是 时 间 点 1 的 观测 的 实际 网 


2&. y, (Kk-1,2,...,K) 是 基于 时 间 点 上 拟 合 模型 的 
P k PERRE, gO 是 节点 连接 时 序 模式 a 
的 网 络 ; 第 四 ， 由 于 NATERGM 是 在 TERGM 
时 序 模式 的 基础 上 加 入 了 节点 属性 ， 因 而 笔者 
将 TERGM 作为 基线 模型 (baseline model), H 
于 比较 NATERGM 拟 合 效果 ， 采 用 威 尔 科 克 森 
符号 秩 检验 验证 NATERGM 的 拟 合 误差 是 否 显 
著 性 低 于 TERGM 的 拟 合 误差 ， 如 公式 CS) 所 


SUE 
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Z=(W'—pw|-0.5)/ow AR (5) 


Hes Dp < SIAD s ADlurerou 70i 
7 是 比较 周期 ,10 是 基线 模型 
TERGM 拟 合 误差 大 于 NATERGM 的 
指示 函数 , R 是 第 i 个 比较 对 的 秩 ; 
Onntl)s o, = n(n))Qn41)/24 DZ 
值 越 高 说 明 NATERGM 拟 合 误差 显著 性 低 于 
TERGM 拟 合 误差 。 


全 百度 糖尿 病 贴吧 实证 研究 


自 2003 年 创建 以 来 ， 尽 管 百度 贴吧 并 非 专 
业 的 在 线 健康 社区 ， 但 其 以 众多 优点 吸引 了 大 
量 的 病 患 ， 组 成 了 庞大 的 病 患者 贴吧 群 ， 目 前 
注册 用 户 超过 10 亿 ， 月 活跃 用 户 突破 3 亿 ， 共 
拥有 1 900 万 个 主题 吧 。 笔 者 选取 百度 糖尿 病 贴 
吧 作 为 最 终 的 研究 对 象 ， 主 要 原因 在 于 : 糖尿 
病 是 一 种 较 常见 的 疾病 ， 病 患 人 群 广 ， 病 患 更 
倾向 于 寻求 情感 慰藉 和 信息 支持 。 
3.1 用 户 交 互 网 络 构 建 
3.1.1 网 络 连接 

由 于 百度 贴吧 会 定期 清理 匈 余 数据 ， 因 此 
抓 取 数 据 的 时 间 跨 度 为 2016 4E 10 H -2018 年 2 
月 ， 共 计 66 周 。 笔 者 采用 Python 的 Scrapy HE 
架 ， 在 抓 取 的 时 间 段 内 ， 百 度 糖 尿 病 吧 中 共有 
23 777 个 用 户 、77 970 条 主 帖 和 80 729 条 回复 ,其 
中 : O 主 帖 是 由 用 户 直接 发 出 在 社区 中 广播 , 按 
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评分 senti(py))， 如 公式 (6 ) 所 示 "9; 
PE Y [56(s)x> ntusd(w, pol(w)] 


oux C5) 
其 中 : @ pj 是 第 i 个 用 户 第 j 条 发 文 的 句 
T% Os 是 第 i 个 用 户 第 j 条 发 文 p; 中 的 语 
句 ; Gn s s 是 情感 非 中 立 的 ，6(s)=1， 如 
Ai] s 是 情感 中 立 的 ，6(s)=0; D w 是 语句 s 
中 的 情感 表达 词语 ; © pol(w) 是 w 在 语句 s 中 
的 极 性 ; © ntusd(w, pol(w)) 是 w 基于 pol(w) 的 
NTUSD 分 值 。 
由 此 ， 第 个 用 户 的 发 文 情感 倾向 ALen; 为 
其 在 数据 抓 取 期 间 ， 所 及 个 发 文 的 情感 平均 
值 , 如 公式 (7 ) 所 示 。 将 4Len; 标 准 化 [0,1] 后 , E 
为 第 i 个 用 户 的 发 文 情感 值 。 


Senti( p) = 


|P; 


Ja 
ASen, - 2,senti(py) pao 

(2) 用 户 发 文 的 文本 长 度 。 第 i 个 用 户 发 

文 的 文本 长 度 ALen, 为 其 在 数据 抓 取 期 间 ， 所 有 
n 个 发 文 的 文本 长 度 平 均值 ， 如 公式 (8 ) 所 示 : 


1 n 
ALen, 2 —M lenth(p;) 
nja 公式 (8) 


HH, Length(p;) 为 第 i 个 用 户 第 j 条 发 文 
p; 的 文本 长 度 。 将 4Len 标 准 化 [0,1] 后 ， 作 为 
第 i 个 用 户 发 文 的 文本 长 度 值 。 

(3) 用 户 的 社区 等 级 。 百 度 贴吧 的 等 级 
制度 是 从 2011 年 9 月 20 日 开始 实行 的 一 项 制 


照 时 间 顺 序 出 现在 社区 主页 ， 是 建立 用 户 连接 
的 一 种 邀请 ; O 回复 是 在 主 帖 下 的 讨论 区 ， 通 
过 自由 回复 建立 用 户 连 接 。 
数据 抓 取 后 ， 通 过 以 下 步骤 进行 清洗 和 预 
处 理 : CD 删除 没有 任何 回复 的 主 帖 ; @@ 删 除 没 
有 参与 任何 交互 的 用 户 ; 加 删除 只 有 视频 / 表情 
包 / 图 片 的 帖子 ; @ 删 除 时 间 相近 的 重复 发 帖 。 
预 处 理 后 得 到 2 301 个 有 效用 户 、6 045 条 主 帖 
和 9 490 条 回复 。 
3.1.2 节点 属性 
(1) 用 户 发 文 的 情感 倾向 。 基 于 中 文 情 感 极 
性 词典 NTUSD， 第 i 个 用 户 第 j 条 发 文 的 情感 
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度 ， 通 过 累计 在 线 时 长 、 参 与 社区 讨论 和 每 日 
签到 等 ， 得 到 用 户 的 社区 等 级 ， 在 贴吧 中 ， 用 
户 的 社区 等 级 分 为 1-9， 反 映 了 用 户 的 社区 参与 
程度 。 第 i 个 用 户 的 社区 等 级 分 类 值 ， 如 公式 (9) 
Biz: 


AGrd=0 9X 1 公式 C) 

其 中 : 中 当 用 户 社区 等 级 在 1-5 区 间 ， 由 

于 所 需 经 验 值 很 少 ， 新 注册 的 用 户 可 以 在 数 天 
之 内 达到 ， 不 能 确切 反映 用 户 的 资历 ， 因 此 , 将 
第 i 个 用 户 的 社区 等 级 分 类 赋值 为 0; DHH 
社区 等 级 在 6-9 区 间 ， 需 要 一 段 时 间 累 计 经 验 
值 ,因此 ,将 第 ;个 用 户 的 社区 等 级 分 类 赋值 为 1。 


202310.03204v1 


chinaXiv 


根据 公式 (7) -公式 (9) ， 节 点 属性 的 描 
述 性 统计 如 表 5 所 示 : 


表 5 节点 属性 的 描述 性 统计 ( N=2301 ) 


节点 属性 均值 标准 差 

用 户 发 文 的 情感 倾向 0.031 0.136 
用 户 发 文 的 文本 长 度 0.163 0.190 
j 户 的 社区 等 级 4.429 1.369 


32 用 户 时 序 交 互 模式 的 NATERGM 拟 合 
3.2.1 用 户 发 文 情感 倾向 的 影响 

百度 糖尿 病 贴吧 中 用 户 发 文 情感 倾向 的 
NATERGM 拟 合 结 果 ， 见 表 6。 用 户 发 文 情感 倾 
向 的 12 个 假设 中 ， 有 4 个 不 成 立 ， 这 是 由 于 发 
文 情感 积极 的 用 户 更 可 能 抢先 连接 其 他 用 户 , 由 
此 更 可 能 被 其 他 用 户 优先 连接 、 传 递 引用 和 循 
环 引 用 。 


表 6 用 户 发 文 情 感 倾 向 的 NATERGM 拟 合 结 


交互 模式 参数 值 ”标准 差 ”假设 检验 
p 4.228*** 0.056 
qum 反馈 —1683*** 0.092 Hla JSZ 
性 回复 2.017*** 0.091 ”H2a 成立 
sin 抢先 ”0.195*** 0.004 ”H3a 成立 
star 拖延 0.000 ”0.034  H4a 不 成 立 
kou- ”优先  0.139*** 0.005 H5a 成 立 
srar Hie 0.042 0.044  H6a 不 成 立 
桥接 0.137 0.000  H7a 不 成 立 
追随 。 0.473*** 0.071 ”H8a 成立 
引用 ”0.334*** 0.076 H9a 成 立 
反 向 桥接 ”0.268 — 0.071 Hl0a 不 成 立 
反 向 追随 0.339*** 0.045 Hlla 成 立 
— 反 向 引用 0285*** 0044 ”Hl2a 成 立 


iE: ***p«0.001; ** p<0.01; * p«0.05 


3.2.2 用 户 发 文 文本 长 度 的 影响 
百度 糖尿 病 贴吧 中 用 户 发 文 文本 长 度 的 
NATERGM 拟 合 结果 ， 见 表 7。 用 户 发 文 文本 长 
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度 的 12 个 假设 中 ， 有 4 个 不 成 立 ， 这 是 由 于 发 
文 文本 较 长 的 用 户 更 可 能 拖延 连接 、 桥 接 和 反 
向 桥接 其 他 用 户 ， 由 此 更 可 能 被 其 他 用 户 传递 
引用 和 循环 引用 。 


表 7 用 户 发 文 文本 长 度 的 NATERGM 拟 合 结果 


交互 模式 参数 值 ”标准 差 ”假设 检验 
N 3241*** 0.050 
互惠 XU  1412*** 0.103 ”Hlb 成立 
性 回复 1.863*** 0102 ”H2b 成 立 
kin. ”抢先 0.004 ”0.001 — H3b 不 成 立 
star 拖延 0.195*** 001 H4b 成 立 
kou- Wn 0.017 0.000  H$5b 不 成 立 
star 滞后 — 0231*** 0.001 ”H6b 成 立 
桥接 ”0.813*** 0.103 — H7b 成 立 
js 追随 0.117 ”0.084 ”H8b 不 成 立 
引用  0.391*** 0.080 Hob 成 立 
反 向 桥接 1.079*** 0.073 H10b 成 立 
P3 反 向 追随 0.071 | 0.046 Hllb 不 成 立 
反 向 引用 0.192*** 0.046 — HI2b 成 立 


iE: *"**p«0.001; **p«0.01; * p«0.05 
323 用 户 社区 等 级 的 影响 

百度 糖尿 病 贴 吧 中 用 户 社 区 等 级 的 
NATERGM 拟 合 结果 ， 见 表 8。 用 户 社区 等 级 的 
12 个 假设 中 ， 有 5 个 不 成 立 ， 这 是 由 于 社区 等 
级 较 高 的 用 户 更 可 能 抢先 连接 、 桥 接 、 传 递 追 
随 其 他 用 户 ， 由 此 更 可 能 反 向 桥接 和 循环 追随 
其 他 用 户 。 
3.3 NATERGM 拟 合 度 检验 

拟 合 度 检验 采用 度 分 布 参 数 "， 包 括 : 标 
准 入 度 、 标 准 出 度 、 偏 态度 和 偏 态 出 度 , 这 
是 因为 在 社交 媒体 网 络 中 ， 度 分 布 最 能 体现 用 
户 如 何 连接 以 及 如 何 参 与 交互 。 首 先 ， 对 数据 
抓 取 期 间 的 数据 ， 根 据 公 式 (A) 以 周 为 单位 
进行 拟 合 检验 ， 分 别针 对 每 种 交互 模式 a， 得 
到 基于 TERGM 和 NATERGM 的 绝对 差异 向 量 
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(4D!, 4D?,...,4D”); 接着 ,以 TERGM 为 参照 NATERGM 拟 合 误差 显著 性 低 于 TERGM WE 
HZ, 进行 威 尔 科 克 森 Ah o fuu, 结果 见 表 9。 误差 ， 具 有 更 好 的 拟 合 度 。 
表 8 用 户 社区 等 级 的 NATERGM 拟 合 结果 
交互 模式 参数 值 标准 差 假设 检验 
pu 3.390 0.050 
2 反馈 1.770*** 0.103 Hlc 成 立 
回复 1.490*** 0.102 H2c 成 立 
抢先 0.110*** 0.001 H3c 成 立 
k-in-star 
拖延 0.015 0.01 H4c 不 成 立 
m LES 0.075 0.001 H5c 不 成 立 
gm 0.051 0.001 H6c 不 成 立 
桥接 0.562*** 0.103 H7c 成 立 
传递 性 追随 0.318** 0.084 H8c 成 立 
引用 -0.160 0.080 H9c 不 成 立 
反问 桥接 0.341*** 0.071 Hl0c 成 立 
循环 性 反 向 追随 0.235*** 0.046 Hllc 成 立 
反问 引用 0.198 0.050 HI2c 不 成 立 
注 : *** p<0.001; **p<0.01; * p«0.05 
表 9 威 尔 科 克 森 符号 秩 检验 结果 
统计 指标 标准 入 度 标准 出 度 偏 态 人 度 偏 态 出 度 
统计 值 5.98 5.67" 445 4.89" 
iE: ***p«0.001; **p«0.01; *p«0.05 
@ 人 研究 结论 及 社区 发 展 建议 回复 与 互惠 性 时 序 反馈 。 
笔者 基于 NAIERGM， 构 建 在 线 健康  .、 WO 
通讯 的 机 制 ， 方 便 用 户 直 接 交 流 ， 并 且 为 发 帖 


社区 中 用 户 时 序 交 互 模式 的 分 析 模 型 ， 将 百 
度 糖 尿 病 贴吧 作为 实证 研究 对 象 ， 验 证 了 应 
用 NATERGM 分 析 用 户 时 序 交 互 模式 的 有 效 
性 ， 揭 示 了 用 户 属 性 对 用 户 时 序 交 互 模式 形成 
的 影响 "1。 

4.1 互惠 性 时 序 模式 的 形成 

HER 性 时 JF R 设 

Hla、Hlb、Hlc、H2a、H2b、H2c JJ S, j 
味 着 发 文 情感 积极 的 用 户 、 发 文 文本 较 长 的 用 
户 以 及 社区 等 级 较 高 的 用 户 倾向 于 互惠 性 时 序 


ü E 


70 


用 户 提供 推荐 列表 ， 邀 请 社区 内 发 文 情感 积极 
的 用 户 、 发 文 文本 较 长 的 用 户 以 及 社区 等 级 较 
高 的 用 户 参与 话题 的 讨论 ， 以 促进 用 户 之 间 的 
活跃 交互 。 
4.2 k-star 时 序 模式 的 形成 

k-in-star 时 序 抢先 假设 中 H3a 和 H3c 均 成 
立 ，H3b 不 成 立 ; k-in-star 时 序 拖延 假设 中 H4b 
成 立 ，H4a 和 H4c 均 不 成 立 。 这 意味 着 当 用 户 
收 到 来 自 贴吧 中 众多 用 户 的 解答 时 ,来自 于 发 
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文 情 感 积 极 的 用 户 和 社区 等 级 较 高 的 用 户 解答 
更 可 能 较 早 ， 即 这 两 类 用 户 更 倾向 于 及 时 回复 
解答 ; 发 文 文本 较 长 的 用 户 倾向 于 延迟 但 详尽 
地 回复 解答 。 

k-out-star 时 序 优 先 假设 中 H5a 成 立 ，H5b 
和 H5c 均 不 成 立 ; k-out-star 时 序 济 后 假设 中 
H6b 成 立 ，H6a 和 H6c 均 不 成 立 。 这 意味 着 当 
众多 用 户 寻 求解 答 时 ， 发 文 情感 积极 的 用 户 更 
可 能 被 优先 回答 ， 但 对 社区 等 级 较 高 的 用 户 并 
无 优先 性 ; AE SCC e IB HP E n] BE SEC Je 
回答 ， 这 是 由 于 解读 长 文本 需要 一 定 的 时 间 ; 在 
线 健康 社区 用 户 更 加 关注 情感 支持 和 信息 支持 。 


ChinaXiv 合 作 期 刊 
知识 管理 论坛 , 2019( 3 ):163-172 
DOI; 10.13266/j.issn.2095-5472.2019.017 


身 经 验 为 其 他 用 户 提 供 交互 契机 。 


合 研 究 局 限 与 展望 


本 研究 在 节点 属性 构建 中 ， 选 取 了 用 户 
发 文 情 感 倾 向 、 发 文 文本 长 度 和 社区 等 级 作为 
用 户 节点 属性 ， 未 来 研究 需要 提高 节点 属性 的 
完备 性 ， 例 如 增加 用 户 发 文 专业 性 。 在 研究 节 
点 属性 的 影响 方面 ， 探 讨 了 单一 节点 属性 对 
网 络 动态 形成 的 影响 ， 未 来 研究 需要 在 现 有 
NATERGM 时 序 模 式 的 基础 上 ， 扩 展 研究 多 种 
节点 属性 相互 影响 与 作用 下 的 网 络 动态 形成 机 
理 。 在 实证 对 象 选 取 中 ， 将 百度 糖尿 病 吧 作为 


情感 支持 有 助 于 构建 活跃 的 社区 氛围 ， 信 
息 支 持 直 接 反映 了 用 户 的 表述 水 平和 投入 程 
度 ， 由 此 ， 建 议 在 线 健康 社区 根据 发 帖 内 容 的 
丰富 程度 ， 给 予 用 户 一 定 的 回复 奖励 ， 以 提高 
用 户 回 复 质量 。 

4.3 传递 性 时 序 模式 与 循环 性 时 序 模式 的 形成 

传递 性 时 序 桥 接 假 设 中 H7b 和 H7c 均 成 
立 ，H7a 不成立; 传递 性 时 序 追 随 假设 中 H8a 
和 H8c 均 成 立 ，H8b 不 成 立 ; 传递 性 引用 假设 
中 H9a 和 H9b 均 成 立 ，H9c 不 成 立 ; 循环 性 时 
序 桥接 假设 中 Hl0b 和 Hil0c 均 成 立 ，H10a 不 成 
立 ; 循环 性 时 序 追 随 假设 中 Hlla 和 Hllc 均 成 
M, Hlib 不 成 立 ; 循环 性 时 序 引 用 假设 中 H12a 
和 Hl2b 均 成 立 ，Hl2c 不 成 立 。 意 味 着 情感 积 
极 的 用 户 更 可 能 通过 积极 追随 其 他 用 户 ， 进 而 
被 其 他 用 户 关 注 引 用 其 发 帖 ， 但 还 不 足以 成 为 
桥接 中 介 ; 发 文 文本 较 长 的 用 户 更 可 能 担当 桥 
接 并 被 其 他 用 户 引 用 其 发 帖 ， 这 是 由 于 发 文 文 
本 较 长 的 用 户 发 文 信息 量 大 ， 因 而 在 用 户 交 互 
过 程 中 提供 了 重要 的 信息 支持 ; 社区 等 级 较 高 
的 用 户 更 可 能 担当 桥接 并 追随 其 他 用 户 ， 这 是 
由 于 社区 等 级 较 高 的 用 户 经 验 丰 富 而 善于 追寻 
有 效 信息 源 。 

信息 支持 与 经 验 分 享 在 交互 网 络 中 很 大 程 
度 上 发 挥 了 中 介 作 用 ， 建议 在 线 健康 社 
区 为 用 户 提供 推荐 列表 ， 能 充分 利用 发 帖 文本 
DERREN DUEAECAHRAE ER 8 


实证 社区 ， 未 来 需要 在 更 多 的 在 线 健康 社区 中 


进行 实证 人 研究， 探究 不 同 社区 中 用 户 交 互 时 序 
模式 的 差异 。 
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Research on the Temporal Interactive Mode Based on User Attributes in Online Health 
Community 


WuBing Peng Yu 
School of Economics and Management, Tongji University, Shanghai 200092 

Abstract: [Purpose/significance] Online health community has been developing rapidly, but it is difficult 
to reveal the inherent mechanism between network node attribute and user dynamic interaction mode, with 
the lack of research on node attribute-based dynamic networks. [Method/process]| This paper constructed 
the research model for users temporal interactive mode of online health community by applying NATERGM 

( Node Attribute-based Temporal Exponential Random Graph Model ) , taking the online health community 
as research object, and combining with the feature of the user node properties that including users emotional 
tendency, the post text and the user community level. Then, data from Baidu Diabetes community from 
October 2016 to February 2018, which involves 2301 users, 6045 posts and 9490 replies, was used for 
empirical research. [Results/conclusion] Results indicate that the validity of NATERGM in analyzing 
temporal interactive mode, and node attributes have significant effects on reciprocity temporal mode, k-star 
temporal mode, transitivity temporal mode and cyclicity temporal mode. Consequently, suggestions for the 
development of online healthy community construction are put forward. 


Keywords: online health community node attribute user interactive mode NATERGM 


